刚刚,Thinking Machines Lab博客提出在策略蒸馏,Qwen被cue 38次
在策略蒸馏(on-policy distillation)是一种将强化学习 (RL) 的纠错相关性与 SFT 的奖励密度相结合的训练方法。在将其用于数学推理和内部聊天助手时,TML 发现在策略蒸馏可以极低的成本超越其他方法。
博客 qwen thinkingmachines think 2025-10-28 08:41 2
在策略蒸馏(on-policy distillation)是一种将强化学习 (RL) 的纠错相关性与 SFT 的奖励密度相结合的训练方法。在将其用于数学推理和内部聊天助手时,TML 发现在策略蒸馏可以极低的成本超越其他方法。
博客 qwen thinkingmachines think 2025-10-28 08:41 2
近日,号称是首个专注于金融市场的 AI 实验室的美国实验室 Nof1 启动了一个将多个 AI 大模型置于真实金融市场中进行自动化交易对决的实验平台。这一项目的名称叫做 Alpha Arena,它是一个 AI 大模型实盘交易竞赛。
这不是什么模拟演练,是真金白银让AI去炒币主办方nof1给六个当红AI大模型,比如通义千问Qwen、DeepSeek、GPT-5这些,每一个都发了一万美金本金,让它们在币圈这个真赌场里比高低。
这项由阿里巴巴Qwen团队完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.17765v1。有兴趣深入了解的读者可以通过该编号在学术数据库中查询完整论文。这项研究首次实现了一个AI模型同时精通文字、语音、图像和视频处理,而且在每个领域的表现
昨日,以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B。该模型有30亿个参数,可在包括手机、电脑在内的多种设备端运行,性能超过Qwen3-4B、Gemma 3-4B等业界顶尖模型。
智能体 开源 transformer qwen gemma 2025-10-09 18:40 3
而阿里,也成为了继OpenAI、Google等之后,又一家宣布入局具身智能赛道的大模型大厂。
昨天,阿里通义千问大语言模型负责人林俊旸在社交媒体上官宣,他们在 Qwen 内部组建了一个小型机器人、具身智能团队,同时表示「多模态基础模型正转变为基础智能体,这些智能体可以利用工具和记忆通过强化学习进行长程推理,它们绝对应该从虚拟世界走向物理世界」。
公司在大模型部门通义千问内组建了一个新的“小队”——机器人与具身智能团队。消息的源头不是官方通稿,而是阿里高管林俊旸在 X 上的一句话:“多模态模型正变成能处理长时序推理任务的基础智能体,而这些智能体——理应从虚拟世界走向物理世界。”
今年的Tech Week更加火热,据说一整周时间里有超过1000场大小活动在这座城市的范围里展开。
金磊 发自 凹非寺量子位 | 公众号 QbitAI它来了,它来了!新一代旗舰模型Qwen3-Max带着满分成绩,正式地来了——国产大模型首次在AIME25和HMMT这两个数学评测榜单拿下100分!
雷军:造车和重启造芯几乎是同时做的决策,把小米前十年攒下的家底全押上了原英特尔芯片架构师苏菲回国,加盟清华大学华为模型交互专利公布理想汽车 CEO 李想谈苹果 iPhone 17 系列手机:今年不会再买 Pro Max 了,实在太丑了马斯克回应 OpenAI
阿里巴巴(BABA.US)涨超2%,最高触及167.82美元,创2021年10月以来新高。消息面上,阿里Qwen团队的负责人在X平台上透露,阿里Qwen团队今晚要发布6个“新东西”,1个产品,2个开源模型,3个API接口。(格隆汇)
刚刚,Qwen推出了新图像编辑模型——Qwen-Image-Edit-2509。
图像编辑 开源 controlnet banana qwen 2025-09-23 16:57 5
推理型大语言模型现在确实火了。这类模型的特点是会先对问题做充分思考,然后再给出答案,而不是直接回复。
9月19日,在亚马逊云科技的Amazon Bedrock模型平台上,上架了两家中国模型公司的新模型,分别是阿里巴巴Qwen3系列四款模型、DeepSeek-V3.1。这两款模型上架Amazon Bedrock,也标志着标志中国的开源模型正在被全球云计算生态认可
模型参数80B,但训练成本连Qwen3-32B的十分之一都不到,并且在32 k以上的上下文推理吞吐能达到后者的十倍以上。
近日,美国头部大模型公司 Anthropic 突然宣布,立即停止向所有由中国资本控股超过 50% 的企业提供 Claude 系列模型服务。基石智算CoresHub 推荐一个完全替代 Claude Code+Claude 模型的 AI 编程组合:Qwen Cod
编程 claude code qwen claudecode 2025-09-11 17:57 7
而且“全球最快开源AI模型”之外,MBZUAI官方还称自家的K2 Think是“有史以来最先进的开源 AI 推理系统”。
今日上午,阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)联合AI创企G42推出的新低成本推理模型K2 Think,相关论文已arXiv预印本平台发表,昨天下午模型在Hugging Face、GitHub上开源。
近年来,中国在大模型领域的发展势头迅猛,特别是开源社区贡献了大量高水平模型。2025年7月,全球最大人工智能开源社区Hugging Face榜单更新,前10名中有9个来自中国。